\section{课题研究背景与意义}
\subsection{研究背景}
近年来，随着互联网技术和社交媒体应用的快速发展，基于社交网络提供服务的应用的种类与使用体量均在迅速增长，推动了社交网络这一典型的图结构数据\cite{kempe2003maximizing,hamilton2017inductive}的各方向的科学研究与工程技术的发展。

影响力传播和传染病模型方向的研究均基于其“传播”\footnote{在此处及后文的论述中，“传播”即代指影响力的传播与传染病的传染两者。}特质，研究者们提出了一系列传播模型\cite{wiki_compartmental_models_epidemiology}，它们定义了传播实体的传播范式，并使用参数规定了其规模与速率，刻画了经典场景下的传播行为，使得其可以被形式化地表示与运算，大幅推进了社交网络信息传播研究领域的理论发展。

本文着重探讨在传播模型未知的前提下，如何在社交网络中进行针对传播行为的多源点检测这一问题。大部分早期研究依赖于特定的传播模型（如后文介绍的SI、SIR等模型），提出了表征模型传播特征的传播源检测算法。然而，在实际的应用场景中，传播模型通常是不明确或难以准确预估的，因此为特定传播模型构建的特化逻辑就具有较差的泛用性。这种局限性使得在模型未知的情况下，通过更具通用性的方法来预测传播源成为了研究的重点。

目前，在潜在传播模型未知的前提下，基于监督学习或自监督学习的传播源预测研究已经取得了广泛发展，有大量工作在问题定义、方法模型和训练模式等方向做出了建设性工作。然而这部分工作仍存在一系列不足之处：
首先，现有的不依赖传播模型的检测算法在小规模社交网络中能够取得较好的检测精度，但当网络规模扩大时，其识别效果会显著下降；
其次，已有的大部分工作采用基于有先验传播源点的监督学习训练方式，而面对无法准确探知源点或只有部分传播序列可知的自监督学习场景的可用性较差；
再次，从置信角度考虑，部分研究假设传播源节点一定存在于最终感染的节点集合中。但在某些实际场景下，部分传播源节点在完成信息传播后可能重新恢复为未感染状态，从而逃避网络监控，这类隐性传播源的存在为检测算法提出了新的挑战，如何有效识别这些隐性传播源成为当前研究中的一个难点；
最后，随着社交网络规模的增长，基于机器学习模型的源点检测方法面临着超线性增长的训练时间成本和硬件存储空间成本，而目前为止，较少有工作对源点检测模型的训练和推理流程进行时间和存储上的工程优化。因此，在大规模社交网络图中提升传播源检测的准确性和效率，也是未来研究的重要方向。

通过探讨这些问题及其解决方案，本文希望为社交网络传播源检测的研究提供新的视角，并为未来的研究工作提供一系列理论和工程实践上的经验。研究在未知潜在传播模型下如何精准识别传播源，不仅有助于抑制谣言、虚假信息和传染病实体的扩散，还能够提高网络信息传播的透明度和可信度以及防疫防控的综合能力，进而维护信息社会的健康发展。

\subsection{研究意义}
社交网络作为现代信息社会的重要组成部分，已逐渐成为人们获取、分享信息以及进行社会互动的主要平台。随着社交网络的广泛应用，信息传播的速度和规模达到了前所未有的水平。这种高度集成化和社区化的信息传播为用户提供了极大的便利，大幅加快了信息的获取和共享过程。然而，社交网络的网状结构意味着传播实体将以指数级的速度在节点中传播，这无疑是一把双刃剑。伴随着信息传播与获取的便利及其背后的商业价值，信息传播的负面效应也逐渐显现，尤其是谣言的快速扩散和虚假信息的泛滥，这些问题不仅影响公众的认知与决策，还对社会的稳定和个人的日常生活产生深远的负面影响。此外，如果将传染病患者及其接触关系视作社交网络的节点与边，社交网络中的信息传播过程就与传染病的传播过程高度类似。因此，对社交网络中信息传播的源点进行精准检测成为了信息管理领域、网络安全领域乃至传染病研究和防控领域中的一个关键研究课题。

社交网络中的信息传播与传播溯源问题是一对影响力传播的互逆问题，在社交网络规模迅速增长并深入社会生活各行各业的背景下，检测社交网络中谣言信息的传播来源在舆情控制方面有着重要的意义。良好的影响力传播溯源模型能够为社交网络迅速识别和划分话题信息的高热区域，为大规模社交网络节点或社群快速构建传播评分，从而在舆情、谣言等影响力话题早期就较为准确地定位到高强度传播区乃至传播源头，进而实现社会舆情与谣言传播的有效管控。
同时，传播溯源的工作同样适用于类似的传染病学模型。基于流行病调查得到的感染情况与感染者的接触关系，良好的溯源算法应能够快速缩小与定位社群内、社群间的传染高危区域，大幅缩减找到传染病初始散播点集或区域的时间，提升传染病的快速管控能力。





\section{本文工作及创新点概述}
本文的主要研究内容是在潜在传播模型这一先验知识未知的前提下，依据对社交网络图结构中节点的标签状态观测得到的快照序列，判断这一标签传播过程的源点集合。
\subsection{\firstChapName}

本文实现了多维特征感知、抽取、处理与融合流程，以此为基础构建了基于逆向序列预测的源点检测方法RSPSI，并针对监督学习和自监督学习两类机器学习训练模式对应提出了RSPSI-S和RSPSI-E两种未知潜在传播模型的多源点检测方法。

在特征抽取方面，本文分别抽取节点标签快照、标签快照序列整体和图节点拓扑信息三个维度的特征数据，在标签快照序列整体这一特征维度中，提供了可扩展化的标签传播参数构建体系，并通过标签类别作为标签特征融合依据，建立了有效的输入特征处理机制；
进一步地，本文为这三个维度的输入特征各自构建了独立的图神经网络处理架构，并将三维特征拼接而成的特征通道（Channel）和节点标签快照序列构成的时序批次（Patch）作为两个混合维度，使用MLP-Mixer模型进行两维度特征混合以进一步提取时序信息和节点信息；
最后，本文将图节点在不同标签快照下对应的嵌入向量通过节点特征-标签序列位置二维编码映射成为Transformer模型的输入和输出序列，并以$|V|$个token构成的token组，即一个标签快照预测值作为序列预测模型的生成粒度，为RSPSI-S模型和RSPSI-E模型分别构建了模型训练流程和模型预测流程。
基于上述工作，本文设计了一系列对比实验以验证模型的有效性和稳定性。
\subsection{\secondChapName}

本文以RSPSI模型为基础，进一步提出了基于切分后的子图训练与子图权重判别器决策的面向大规模社交网络图数据模型CRSPSI，并同样基于两类机器学习训练模式提出了CRSPSI-S和CRSPSI-E两种可应用于极大规模图数据的多源点检测方法。

CRSPSI方法通过使用图分割算法，以最小化分割后子图间连接数为目标，将整图数据划分为一系列子图，并在每个子图上按照机器学习训练模式分别构建相应的RSPSI-S或RSPSI-E模型，使用与整图训练和预测流程相同的方法，将数据按子图维度切分后进行计算、训练和预测。

为了进一步表征社交网络图数据中的社群传播特征，CRSPSI构建了子图模型共用的子图权重判别器，其接受标签快照序列整体和节点拓扑数据两个维度的特征，并使用基于MLP-Mixer的基础模型，以上述特征嵌入为特征通道，以子图为批次的两维度特征混合表征子图标签传播的相对活跃情况，最终输出子图任务计算结果的权重。

最后，CRSPSI方法在工程实现上采用了基于Offloading的训练和预测流程，通过以子图模型及其计算流程为控制单元，构建了以GPU为主、同时充分利用CPU剩余算力的GPU-CPU协作训练和预测方法，确保整个模型的训练和预测流程即使在显存有限的情况下也能顺利、高效地进行。
基于上述工作，本文同样设计了一系列对比实验以验证模型的有效性、鲁棒性和效率。


\section{本文组织结构}

第1章，绪论。该章对本文所研究问题的背景、现状和文章整体框架进行了说明。 

第2章，\chapTwoName。该章对近年来社交网络传播源检测领域相关工作进行了文献综述，并进一步介绍了与本文研究相关的重要基础研究及其提出的方式方法。

第3章，\firstChapName。该章介绍了本文设计实现的基于逆向序列预测模型的源点检测方法RSPSI的整体思路，以及这一方法在监督学习训练模式和自监督学习训练模式上对应的RSPSI-S和RSPSI-E两种具体实现。

第4章，\secondChapName。该章介绍了本文基于前述已提出的RSPSI方法以及图机器学习领域常用的优化技巧，设计实现了基于划分子图后分块处理与子图权重判别模型的源点检测方法CRSPSI，以及这一方法在监督学习训练模式和自监督学习训练模式上对应的CRSPSI-S和CRSPSI-E两种具体实现。

第5章，实验设计与结果分析。该章介绍了本文为前述两章提出的源点检测方法设计的对比实验体系的实验环境、基准数据集、数据输入生成流程和基线对比方法等一系列实验前置信息，进一步分模块地进行了围绕所提出模型的基线模型效果对比实验、验证模型关键设计有效性的消融实验、验证模型参数以及实现形式选择的对比实验和验证模型工程实现流程高效性的性能实验等工作，并分别对实验结果进行了详细的分析总结。

第6章，总结与展望。该章对全文的模型设计、实验结果等工作内容进行总结和分析，并围绕工作的本身的不足之处以及可深入研究的方向进行对未来工作的展望。